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-١‏ مقدمة 
مع تطور الحواسيب والاتصالات» برزت الحاحة إلى استخدام الحاسوب في الكثير من التطبيقات 
الحيوية. وتنامت هذه الاستخدامات إلى تطبيقات مفيدة وحيدة تي كثير من البجالات. ولما كان 
التواصل الكلامي أسهل وأخحع أنواع التواصل» يجرى العمل ال غل ا الجيل الخامس من 

الحواسيب الذي يتواصل کلامیاً مع اللستخدم. 
يجري العمل حالياً في كثير من لغات العام على تطوير تطبيقات لغوية (نصية وكلامية) لأغراض 
متنوعة. فلديناء على سبيل الخال لا الخصر: 

الألى: 

۲- تطبيقات ت ركيب الكلام من نصوص مكتوبة أو نصوص مولدة؛ وأبلغ مثال عليها قراءة 
الكتب اللمكفرفن و اليب الال رقراءة الريك الالكرون ضرا من بعد وغرها. 

۳- تطبيقات التنقيب عن المعطيات والمعلومات والمعرفة» ولا نخفى على أحد أهمية هذه 
التطبيقات» وحاصة مع انتشار شبكة الإنترنت (الشبكة العنكبوتية العالمية). 

٤‏ - التطبيقات التفاعلية كالألعاب ونظم الاستفسارات 


-٥‏ الترجمة الآلية 


-٦‏ تعليم اللغات للأحانب 
۷- التصحيح الإملائي الآلي. 
تتطلب كل هذه التطبيقات دراسة معمقة لعلم اللغات» ومعالحة الإشارة» وعلوم الحاسوب» وعلم 
الإإحصاء» وتقانات الذكاء الصنعي»... ويتحدث اللغة العربية ما لا يقل عن 250 ملييون عربي» 
ويهتم بتعلمها قرابة 1.2 مليار من المسلمين» كما أَما تحظى باهتمام متزايد حن من الأوساط غير 
الملسلمة وغير الناطقة بالعربية» فما هو حظها من التقنيات الحديثة؟ 
بمكن تصنيف الأعمال على اللغة العربية ضمن: 
ه معالحة الإشارة الكلامية: 
ف ر کی الحا 
تعرٴٌف الكلام 
ه ضغط الكلام 
ه العالجحة النصية: 
ه معالجحة على المستوى الصرف: ويجري الاهتمام قي هذه المرحلة بدراسة بنية الكلمة 
وكيفية تشكيل الكلمة من المكونات الأساسية المكونة ها 
ه معالحة على المستوى النحوي: حيث بحري دراسة العلاقات البنيوية بين الكلمات 
لتشكيل احمل 
ه معالجحة على المستوى الدلالي: حيث يهتم هذا المستوى بدراسة معان الكلمات» 
رع تلك الان فشكل صان ال 
ه معالجة على المستوى المقامي أو الاستعرائي 0SناةمعهإP:‏ حيث بحري دراسة اللغغفة 
كما تستخدم قي سياقها الاحتماعي» ما في ذلك تأثيرها على المتحدثين. 


وتعاني هذه المستويات جمیعاً من مسألة اللبس أو الغموض راندعناطه» حيث يمكن أن يكون 
لخر ج المعالحة في كل مستوى عدة احتمالات يمكن إزالتها (أو إزالة حزء منها) قي المستوى التالي. 


۲- تحليل وت ركيب الإشارة الكلامية 


فيما يتعلق بت ركيب الكلام» حاول الإنسان منذ ستينيات القرن الماضي» إنتاج إشارة تشبه إشارة 


الكلام بطرق ميكانيكية ثم كهربائية واا حاسوبية رقمية» وذلك ا على فهم آلية إنتاج 
الكلام عند الإنسان ونمذجة هذه العملية» فظهرت م ركبات الكلام المتعددة وللغات عديدة. 


ول ركبات الكلام تطبيقات كثيرة منها: 


الاستفسار عن معلومات متغيرة عن طريق الماتف (كالحسابات المصرفية» أو اسم شخص 
وعنوانه من رقم هاتفه» أو العكس» أو حدمات الحجز وتسجيل الطلبات عن طريق الهاتف» 
أو الاستماع إلى الفكسات والبريد الإلكترون عن طريق الهاتف» ...). 

الماتفية المفسرة (الترجمة المباشرة للمكالمات الماتفية)» وهذه الخدمة تتيح لشخصين لا 
يتحدثان لغة واحدة بالحديث ا على الهاتف. 

الحالات الي يصعب فيها النظر إلى الشاشة (كغرفة قيادة طائرة)» وتوحيه حط سير 
العربات. 

الخدمات المتعلقة بالمعاقين (كإيجاد آلة قراءة للمكفوفين» وتمكين الأشخاص الذين لديهم 
إعاقة كلامية من الكلام والرد على الهاتف). 


تختلف من کنات الكلام هذه بحسب: 


الوحدات الصوتية الأساسية الي يجري ضمها لإنتاج الكلمات والجمل المختلفة» فمنها ما 
یعتمد على کلمات E‏ وهذا يصلح لتطبيقات محدودة الكلمات. ومنها ما يعتمد 
على الثنائيات الصوتية [96 اiهاط]‏ وهي النقلات بين الأصوات المفردة» الي يستخدمها 
معظم مر کبات الكلام التجارية. ومنها ما يعتمد على المقاطع الصوتية ]00 «[Chenfour‏ 
وهي تعطي نوعية أفضل على حساب تعقيد التصميم وزمن التطوير. 

تقنيات الت ركيب منها ما يعتمد على تحليل الإشارة قي ابحال الزميْ» ومنها ما يعتمد على 
تحليل الإشارة ني جال الترددي (متواها من النغمات)» ومنها ما يعتمد على تحويلات 
مغايرة. 

ه تحليل وت ركيب الإشارة قي اجال الزميْ: يجري ضم الوحدات السابقة» وتطبيق 
معالجات معينة عليها بمدف تغيير شدة الكلام E‏ 
حديثة أنبتت حدواها يعتمد أغلبها على كشف لحظات انغلاق الأوتار الصوتية 
ومنها كشف الدور الأساسي لاهتزاز الأوتار الصوتية» ومعالحة الإشارة على 


مستوى هذا الدور. تسمى هذه التقنيات تقنيات تراكب وجمع متزامنة مع الدور 
الأساسي [Dutoit 96] Pitch Synchronous Overlap and Add (PSOLA)‏ . 

ه تحليل وت ركيب الإشارة قي ابحال الترددي: يتدحل هواء التنفس في عملية إنقاج 
الكلام» إذ يخرج المواء من القصبة الموائية إلى التجويف الفموي الذي يتشكل 
اکال دة خب الوت الط ف ا لدو ماد ترا ق ترا 
فن العا عة الاد ر اف فك الجر قمر ها سر ها 
الترددات الي نسميها البواني. تعتمد طرق ت ركيب الكلام ترددیا على کشف هذه 
الترددات ثم إنتاحها ا RS‏ مرشحات. ومع أن هذه 
الطريقة أقرب إلى الطبيعية من غيرها لاما تعتمد على موسطات فيزيائية حقيقية 
تتصف بالاستمرارية والواقعية إلا أن صعوبة تحديد موسطاتهما جعلتها تتراحع أمام 
التقنيات الأحرى. 

ه تحليل وت ركيب الإشارة باستخدام التحويلات: نمة طيف واسع من التحويلات الي 
بمكن استخدامها لت ركيب الإشارة الكلامية» تمدف في معظمها إلى ت ركيب كلام 
بنوعية أفضل وبحجم حزن أقل تناسب التطبيقات الشبكية والنقالة وغيرها. 


۴- تعرف الإشارة الكلامية 
الهدف منه تعرف المضمون النصي للكلام المنطوق» وله تطبيقات كثيرة منها الإملاء الآلي وإعطاء 
أوامر صوتية للالة [06 kه))ه٥-A1]»‏ إضافة إلى تطبيقات متعددة في محال الألعاب. 
وتختلف نظم التعرف بحسب عدة معايير: 
ه الوحدة الصوتية الي يجري تعرفها: كلمات معزولة أم كلمات متصلة أم كلام 
طبیعی تمر ریک آن پتضمن سعالا او کلمات من لغ ری 
ه حجم الوحدات الصوتية: عدد الكلمات المتعرفة. 
٠‏ تعرف بصوت متحدث وحيد أم عدة متحدثين أم بدون شروط على المتحدث. 
ه مونوقية نظام التعرف بحسب تغيير ظروف استنماره. 


وتختلف تقنيات التعرف تبعاً لما يتطابه نظام التعرف: 


ففي حال تعرف الكلمات المعزولة أو المتصلة» بمكن استخدام التقنيات نفسها مهما كانت اللغة. 
وتعتمد هذه التقنيات على قياس درحة التشابه بين نماذج خزنة طمذه الكلمات» وبين الكلمات ال 
يلفظها المستخدم لتعرفها. نذكر من هذه التقنيات: 

Dynamic Time Wrapping (DTW) ةıكıمliıدلl البرحة‎ 

Neural Networks ةaigبصعلl الشبكات‎ 


ه نماذج ما ركوف llئخèية Hidden Markov Models‏ 
أما ي حال تعرف الكلام المستمر» فإن الوحدات الي يمكن تعرفها لن تتحاوز الأصوات المفردة 
وعلينا إضافة مكونات لغوية غنية على نظام التعرف» لنتمكن من استنتاج الكلمات المنطوقة من 
الأصوات المفردة؛ فالمتحدث بكلام طبيعي قد يدغم أصواتا SE IT‏ 


أ ار ا ا ا Ê Û6 E‏ 


->٤‏ منتجات عالية 


تحظى اللغات الأحرى غير اللغة العربية (أوروبية وآسيوية وهندية...) بنصيب أوفر من البحث 
والتطوير. فمنذ عقود توحد م ركبات كلام بلغات متعددة» ونظم تعرف بكلمات معزولة تصل إلى 
بضعة آلاف» ونظم تعرّف كلام مستمر لمقامات معينة: حجر سفر» استفسار عن حالة الطقس وعن 
حالات الطرق تصل إلى نسب تعرف تزيد على %01 ]06 .[Haton‏ 

وني الآونة الأحيرة» ازداد اهتمام العرب والمسلمين باللغة العربية» وتعدى الاهتمام باللغة العربية ليصل 
إلى الأوساط غير المسلمة وغير الناطقة بالعربية. وسنذكر فيما يلي بعض الشركات المشهورة ي 
اجال. 


-۱-٤‏ شر کة مایکروسوفت: تقدم برحیات M٥0۴ 0e‏ مایکروسوفت الک دع اة 
العربية ويتضمن محررهاء قاموساً للمفردات العربية» وقواميس ثنائية اللغة من العربية وإليهاء مصححا 
للأحطاء الإملائية والنحوية وإن كان المتتج لا يخلو من بعض الأحطاء. أما كلاميا فهو لا يقدم أي 
منتج حاص باللغة العربية. 


٤‏ --شر كة صخر: تقدم شر كة صخر العريقة قي محال تقانات الكلام محموعة منتجات تتضمن: 


القارئ الآلي: وهو نظام تعرف نصوص مكتوبة 
وتطبيقات الحاسوب» كما يستخدم لقراءة المستندات والكتب المطبوعة وحفظها 
وطباعتها بالطريقة العادية أو طريقة برايل. ويتيح أيضاً إمكان التعامل ممع كافة 
العطيات صوتيا على الجهاز أو الإنترنت لأنه يتضمن م ركب كلام من نصوص 
مكحتو بة. 

ه عحرك البحث "الإدريسى" للغة العربية. 

ه مرك صخر للتعرف الآلي على كلمات معزولة ومتصلة بلهجات ختلفة. 

ه مرك صخر لنطق النصوص: يسمح بنطق النصوص المكتوبة باللغة العربية أو 
الإنكليزية» بقطع النظر عن كوا مشكولة أم لا لأنه يتضمن مشكلا آليا للنصوص 
العربية. 

إضافة إل خمرغة برخيات أعرى للترجة من وإل الإنكليرية والأرشةة والتلخ يصن 
والتصحيح الآلي والتصنيف وتعقب الكلمات المفتاحية. 


يوحد على موقع شر كة صخر ùl http://www.sakhr.con/tts/tts3 1 .asp‏ لتجريب النظام. 


لا تتوفر لدينا وثائق عن التقنيات المستخدمة أو عن قياس أداء هذه النظم» ال تعتبر باهظة الثمن 
بالنسبة للأفراد. 


٤‏ -٣-ش‏ ر کة أکابیلا: 
نشت في بداية عام 2004 شر كة عالمية اممهءA‏ تتكون من ثلاث شركات عالمية وعريققة في 
تكنولوجيا معالحة الكلام: 
:Babe1 Technologies‏ تأسست ق بلجیکا عام 1995» کفرع من كلية 1sهM‏ للتقانات 
لمتعددة قي بلجيكاء وهي شركة رائدة قي ت ركيب الكلام وتعرفه والنظم المضمنة. 
:1nf0v0×‏ تأسست في السويد في عام ۱۹۸۳ء كفرع من المعهد الملكي للتقانات 1۴> 
رائدة ني محال ت ركيب الكلام لعدة لغات» وني محال الاتصالات. 


Elan Speech‏ : تأسست قي فرنسا في عام 1980ء رائدة قي ت ركيب الكلام والاتصالات 
تدعم الشركة 23 لغة عالمية منها العربية. يوجحد على مyتعl4q |http://demo.acapela-group.com‏ 


إمكان جريب وعرض نظم ت ركيب الكلام من نصوص ل 14 لغة منها العربية. يجري الت ركيب 


-٠‏ اللغة العربية في المعهد العالي للعلوم التطبيقية والتكنولوجيا 
يشارك المعهد العالي قي اللجنة الفرعية لشمال أفريقيا وغرب آسيا من لحنة الاتصالات الكلامية 
العالمية 1804. وفيما يلي عرض لأهم الأعمال الي حرت وجحري ق المعهد العالي» ق محال 
المعالجحة النصية والكلامية للغة العربية: 


٧-۵‏ نظام اشتقاق وتصريف [البواب :]۸٤‏ يعتمد ا یتضمن ٥٥۸۸‏ ت ا 
و۹۳۲٠‏ جذرا رباعياء كما يحوي المعجم على ١٠۷۹١‏ مصدرا ماعيا و٠٦۸‏ صفة مشبهة بالفغععىل 
حاصة بالأفعال الثلاثية المحردة. 

أما الأسماء المشتقة القياسية و كذلك المصادر القياسية الخاصة بالأفعال الثلاثية المزيدة والأفعال الرباعية 


فما تولد في نظام الاشتقاق وفق قواعد حددة دون الرحوع إلى المعجم. 


-۲-٥‏ قاعدة معطيات قواعد الإعراب [باكير :]٠۲‏ يهدف لمشروع إلى إعراب كم وافر مسن 
الشواهد والأمثلة المتنوعة» وصلت إلى ٠٠٠١‏ شاهد» ثم وضعها في قاعدة معطيات؛ لتكون ر 
ن ت و اا لبرامج تعليم قواعد اللغة العربية بالحاسوب. وقد انتقيت الشواهد ممن 
الأدب الرفيع» وبحيث تناسب مختلف المراحل الدراسية» وتغطي جيع الدروس النحوية. وقد شرحت 
الشواهد مفردات فقط» قي حين كان إعراب الشراهد فصا اما غیت مک لکل طالب: و 


ماية التعليم الأساسي» حن التعليم الجامعي» وانتهاء بالباحثين» أن جد كل مبتغاه. 


-۳-٠١‏ قاموس إلكترون "قاعدة معطيات المعجم الوسيط": المدف من هذا المشروع إدحال 
مفردات العجم تي قاعدة معطيات» حیث جریى تصنيفها تي ١١‏ بو قق اللات الصرفية 
والدلالية المتعلقة بما. لقد حرى بناء هذه القاعدة بحيث تشكل نواة أساسية لأعمال تحليل صرق 


ونحوي ودلالي لاحقة. على سبيل المثال يتضمن حدول الأفعال في القاعدة عشرة حقول هي: رقم 


مفتاح الفعل» شيوعه» جحذره» الفعل نفسه» وزنه» تعديته» اسم الفاعل منه» حرف التعدية» اسم 
المفعول منه» معناه. 


-٤-٥‏ نواة نظام تشكيل النصوص: تكتب النصوص باللغة العربية» في غالب الأحيان» من دون 
تشكيل. وحين القراءة» يستطيع القارئ المتمرس استعادة الح ركات بناء على خبرته» أما الققارئ 
المبتدئ فلا يستطيع ذلك. تحمل هذه الح ر كات معلومات لغوية هامة منها دلالية ومنها نحوية» 
E DT A TT ST‏ 
يهدف هذا المشروع إلى بناء نواة مشكل آلي للنصوص العربية» يضيف ما أمكن من الح ركات 
والشدات إلى نص غير مشكول. 
يتألف المشروع من المراحل التالية: 

]هعاuاه١ مسح النص وتقسیمه إلى كلمات ع«ذوإو۴: باستخدام قواعد لغة منتظمة‎ .١ 

language 


۲. التحليل الصرفي للکلمات ونوراھ ¬۸ ica1عoاەMorph:‏ جر اعتnاد Buckwalter JJ‏ 
الصري [2002 ۲١اه‏ س)ءں8]» والذي يستخدم طريقة معاحم السوابق والجذوع واللواحق 
ولوائح التوافق. تعتمد هذه الطريقة على وحود ثلائة معاحم: معجم الجذوع اللغوية ويمحوي 
الجذوع مع التحليلات الممكنة لكل منهاء ومعجم السوابق مع التحليلات الممكنة لكل سابقة» 
ومعجم اللواحق مع التحليلات الممكنة لكل لاحقة. 
إضافة إلى هذه المعاحم توجد لائحتان: اللائحة الأول وهي لائحة توافق السوابق مع الجذوع» 
فمثا حرف العطف (تحليل لسابقة) متوافق مع الفعل (تحليل لحذع)» واللائحة الثانية تحدد 
توافق الجحذوع مع اللواحق. 
يقوم امحلل الصرف بإحراء التقسيمات الممكنة لكل كلمة إلى سابقة-حذع-لاحقة» على ألا 
یکون طول الحذع صفراً. 
ويختبر لكل تقسيم الشروط التالية: 

ه هل السابقة موجحودة في معجم السوابق؟ إذا كانت موجودة يستخرج التحليل اللغوي 
الموافق. 


e‏ هل الجذى موجحود ق معجم الجذوع؟ إذا کانت ا يستخ رج التحليل اللغوي 
الموافق. 
© هل اللاحقة موحودة ف معجم اللواحق؟ إذا كانت موجحوده پت رچ التحليل اللغوي 
الموافق. 
ه هل تحليل السابقة متوافق مع تحليل الجذع؟ 
ه هل تحليل اللاحقة متوافق مع تحليل الجحذع؟ 
إذا تحققت جيع الشروط السابقة يعتبر التقسيم للموافق ا ا ويضاف إلى 
التقسيمات الممكنة. 
مثال على طريقة إ٥)a1س‏ )ں8 للتحليل الصرق: 
مك أن يكرت لكلمة ورد امات اإلالة: 
e‏ ورد: نستخرجها في معجم الجذوع فنحصل على الحالات ورد وهي فعل- ورد وهي 
اسم = ورد وهي اسم = ورد وهي فعل 
ه و-رد: نستخرج الواو قي معجم السوابق فنجد أَما حرف عطف» ثم نستخ رج أرد/ 
من معجم الجذوع فنجد أنه فعل» نختبر التوافق بين حرف العطف والفعل فنجد أَمُما 
متوافقان» وبالتالي ينتج لدينا التحليل ورد 
٠ه‏ ور-د: هذا التقسيم غير صالح لأن /ور/ ليس من السوابق» و أد/ ليس من الجذوع. 
و-رد: هذا التقسيم غير صالح لأن /و/ ليست من الجذوع و أرد/ ليست من 
اللواحق. 
سور-د: هذا التقسيم غير صا لن أور/ ليست من الجذوع و أد| ليست من 
اللواحق. 


.٣‏ تحديد أنواع الكلمات :Part of Speech Tagging‏ بعد عملية التحليل الصرقي ينتج (في 
الحالة العامة) لكل كلمة عدة خيارات» كل خيار مرتبط بتشكيل معين هذه الكلمة» وبالتالي 
تؤول عملية التشكيل الآلي إلى اختيار الخيار الأنسب. في هذه المرحلة نسعى إلى إجراء عمليية 
تحدید لنوع الكلمة ۶08 من خلال بناء إمععه٣‏ للغة العربية. ولافتقارنا إلى مدونة ممشكولة 
باللغة العربية توجهنا إلى اعتماد طرق إحصائية ترف بالتعلم غير الشرف عليه 


supervised learning‏ . تعتمد هذه الطريقة على تطبيق الخطوتين السابقتين على كم واسع 
من النصوص غير المشكلة واستنتاج قواعد إحصائية للتعليم (إحصاء الحالات الي لا لبس فيها 
واستنتاج قواعد منها)» ثم ترتيب هذه القواعد بحسب علامات تعطى هماء تأحذ بالاعتبار 
تكرار تطبيقها على النصوص. ولدى تعليم نصوص حديدة نطبق القواعد الي ها العلامات 
الأفضل» ثم نطبق قواعد تحويل لتحسين الأداء (إزالة الغموض أكثر) اعتماداً على الكلمة 
السابقة ونوعها والكلمة اللاحقة ونوعها. 
عملياء قمنا بحمع ثلاثة نصوص عربية متنوعة من الموسوعة العربيية [06 ا1لةfة؟]‏ وهذه 
النصوص هي: نص عن الحاسب ونص عن كوكب الأرض ونص عن مدينة دمشق» يبلغ 
مجحموعها قرابة ۱۸٠٠٠‏ كلمة. ومن ثم قمنا بتمرير النص على المحلل الصري وأحصينا 
الاحتمالات الي أعطاها المحلل لكل حالةء فتبين لنا النتائج التالية: 

.0٦٠ نسبة الغموض هى‎ ٠ 

٠‏ تشكل الكلمات غير الغامضة 04٠‏ من النص. 

ه 0۳ من الكلمات ل يتعرف عليها الحلل. 

' ۳ من الكلمات کان ما علامتان sچھا wo‏ آ 

ه 0۱٤١‏ من الكلمات كان ها ثلاثة علامات. 

Vv @‏ م الكلمات کان ا أربع علامات. 

مثال: لتكن لدينا جملة "وصل الأستاذ إلى مصر". في هذه المرحلة تُعلّم كل كلمة بجميہ 
الاحتمالات الممكنة ها (0 تعن أو): 
yص J ERB_PERFECTYNOUN‏ (فعل تام»› اسم) 
الأستاذ NOUN‏ (اسم) 


ای PREP‏ (حرف جر) 


مصر AD N00N_P۸0°‏ (صفة» اسم علم) 


>. تطبيق القواعد اللغوية التجريبية :Heuristie Linguistic Rules‏ بعد القيام بالمراحل 
السابقة» قمنا بإضافة مرحلة أحرى» وهي القواعد اللغوية التجريبية» حيث لاحظنا أن القواعد 
اا ا تغفل أحياناً بعض الحالات السهلة المعالحة. إضافة إلى هذا فإن القواعد محدودة 
بالقوالب الحددة» وبالتالي لا تغطي جيع الاحتمالات الممكنة. 


قمنا بإضافة قواعد لغوية تحريبية وبتجربة الأداء بعد إضافة كل قاعدة» بمدف إبقاء القواعد 
الجيدة وحذف السيعة منها. من هذه القواعد على سبيل المغال: 
- إذا كان طول الكلمة أصغر من ثلاثة» وأحد الاحتمالات الممكنة هو حرف حر ۲٤ظ۴R‏ 
قم باحتیار هذا الاحتمال. 


وقد حسنت هذه القواعد من نتائج برجية الك ونقوم الآن باعداد مدونة مشكلة و من 
نصوص الموسوعة العربية السالفة الذكر»ء نما سيسمح بقياس أداء البرجحية بدقة أفضل. ليس ف مقدور 
هذه البريحية تشكيل أواحر الكلمات» ا لأن ذلك يتطلب بناء محلل نحوي للغة العربية. 


ه-ه- م ركب كلام باستخدام الثنائيات الصوتية. 
يقالت مر كب الكلد الم جرد خالا ف لهك الال من عدة كل 
.١‏ كتلة التحويل من رموز كتابية إلى رموز صوتية. 
۲. كتلة التحويل من رموز صوتية إلى أصوات منطوقة. 
۳. كتلة تعديل أنغاط النطق التطريزية هه١٠۴۲‏ لإعطاء صوت طبيعي ثم لإعطاء اللمشاعر 
ا 
وفيما يلي تفصيل هذه الكتل. 


.١‏ كتلة التحويل من رموز كتابية إلى رموز صوتية. 

اعتمد قي إنشاء هذه الكتلة على نواة بناء نظام خحبیر 10۲۴ كان قد جحرى إنشاؤه في معههد 
الاتصالات الكلامية ]nstitut de 1a communication‏ ي مدينة غرونوبل للغة الفرنسية» م طق على 
محموعة من اللغات الأججدية» منها الألمانية والإيطالية والإسبانية. حرى استخدام هذه النواة لبناء نظام 
حبير حاص باللغة العربية [غنيم .]٠۳‏ يسمح هذا النظام للخبير بصياغة قواعد التحويل ممن رموز 
كتابية إلى رموز صوتية» على نحو يشبه قواعد تعليم القراءة للصغار أو للأجانب. 

على سبيل المثال: حذف لفظ اللام الشمسية» وحذف لفظ همزة الوصل» وإضافة لفظ التنوين. 


دحل هذه الكتلة نص مشكول» وخرحها جحموعة رموز صوتية (۳۸ رمز). 


۲. كتلة التحويل من رموز صوتية إلى أصوات منطوقة. 


نستخدم في هذه الكتلة بجموعة برمحيات متاحة على الإنترنت هي 8۸014 بمكنها تحويل الرموز 
الصوتية السابقة إلى أصوات موافقة» باستخدام تسجيلات صوتية للنقلات بين صوتين متتالين 
(الثنائيات الصوتية 658١٥طمزل).‏ تسمح هذه البرجحيات بالتحكم في مدة كل صوت مفرد وبتردد 
الأوتار الصوتية الموافقء إلا أا تفتقر إلى الأصوات الموافقة للواو والياء الممالتين اللتين قظهران مغلا 
حين نقف على كلمة تنتهي بتنوين الضم أو الكسر. 

۳. كتلة تعديل اط النطق التطريزية رله١٠إ۲‏ لإعطاء صوت طبيعي» ثم لإعطاء المشاعر 
المطلوبة. 

E O O E O E O E 
لكل من أغاط الكلام الأربعة: إحبار واستفهام وتعحب وهُي. قام بنطقها مسة أشخاص (> ذكور‎ 
صوتيم. حيث حرى استخراج‎ ٠١ وأنشى). ويقصد بالجمل القصيرة ما قل عدد الأصوات فيها عن‎ 
تغيرات التردد الأساسي وشدة الصوت مع الزمن.‎ 

م حرى تسجيل مدونة أحرى لحمل ذات أطوال متوسطة وطويلة» وتحليلها أيضاء واستخراج قواعد 
تلك التغيرات باحتلاف طول الجحملة. 

اعتمدنا جحموعة قواعد تعديل أولية» تأحذ بالاعتبار أدوات التنقيط (الفاصلة والنقطة وإشارة التعحب 


وإشارة الاستفهام)» وعدد صوتيمات الحملة. 


E E E N TY‏ الففرح» والغفضب 
والحزن والخوف والمفاجحأة. حرى تسجيل ٠١‏ جلة لكل عاطفة» مرة بتعمد إظهار العاطفة ومرة 
بكلام طبيعي من دون عاطفة» وحرت دراسة التغيرات الي تطرأً على موسطات النطق (تردد أساسي 
ومدة وشدة صوت) حين يتضمن الكلام العواطف السابقة» ومن ثم بناء قواعد لإجراء التحويلات 
المناسبة لتحمل جمل الم ركب الصون إحدى العواطف المدروسة. ولتحديد أداء ت ركيب العواطف» 
جحرى ت ركيب خمس جمل لكل عاطفة» استمع إليها ١‏ أشخاص طلي مه ديه العا ة اللي 
يشعرون بها لكل جملة» وكانت نسبة تعرّف العواطف المركبة متفاوتة من عاطفة إلى أحرى تتراوح 


بين 67% لعاطفة الفرح و 80% لعاطفة الخوف [05 kة))a٥-۸1].‏ 


-٦-٥‏ نواة ل ركب باستخدام أنصاف المقاطع. 


نظرا لقصور الثنائيات الصوتية في إنتاح كلام عالي الحودة» ولكون اللغة العربية لغة مقاطعية» فققد 
ارتأينا إعادة بناء م ركب الكلام باستخدام أنصاف مقاطع ا عن الشنائيات الصوتية. الجدير 


بالذكر أن أنواع المقاطع الصوتية قي اللغة العربية ههي: ۷ء و €۷ و €۷€ و ۷٣٣‏ (۷ ههي 
الصوائت و ٤‏ هي الصوامت)» وأنصاف المقاطع هي ما ينتج حين نقص المقطع الصوت عند الصائت. 
فتنتج أنصاف المقاطع التالية: #C©۷‏ و ۷V©#‏ و ۷٣€#‏ و۷٤۷‏ و ۷C۷‏ (يشير # إلى الصمت قبل 
الكلام أو بعده). 

إن عدد الثنائيات الصوتية لا يتجاوز 1500 (ل 38 صوتيم). أما عدد أنصاف المقاطع» فهو يتجاوز 
0 بعد استبعاد الصوامت التنافرة. انتهى تسجيل المدونة الي تتضمن أنصاف المقاطع بصوت 
أنثوي» وبقي تقطيعها وتحليلها. 


-۷-٥‏ نظام تعرف كلمات معزولة 

يهدف هذا التطبيق إلى التحكم الصوت قي ربوط (ذراع آلي)» موصول إلى حاسوب. يتكون هذا 
الذراع من خمسة مفاصل: قاعدة وكتف ومرفق ومعصم و قبضة. كل من المفاصل الأربعة الأول 
يعكن أن يتحرك خو: اليمين أو اليسار أو الأعلى أو الأسفل» أما القبضة فتكون حركتها بالفتح او 
الإغلاق. 

يتكون الأمر من بحموعة كلمات هي على التتالي: 

اا ا کو که ار که 

ا ا ی ا ر 
اليسار (وبذلك يكون عدد كلمات التعرف 21 كلمة)» أو بالطريقة المعتادة (ويكون عدد كلمات 
التعرف 42 كلمة. 

التقنية المستخدمة في التعرف» هى تقنية ما ر كوف المخفية. نسبة التعرف 0100 للشخحص الذي درب 
نظام التعرف» و 0682 للآحرين للتشكيلة المعتمدة (حجم النماذج الصوتية size‏ 0kمطاملمc‏ هو 


2 وأحذ 15 موسط سبستروم لكل نموذج مع مشتقيه الأول والثان). 


-۸-٥‏ تعرف الط العريي 

قدم المعهد العالي للعلوم التطبيقية والتكنولوحيا مع المنظمة العربية للتربية والثقافة والعلوم منتجا لتعرف 
حروف الخط العربي "نظام التعرف الضوئي على الخط العربي". يستطيع هذا البرنامج التعرف على 
الأحرف العربية مخحتلف أشكاهما إلا التزينية منها ( الي تكثر فيها الميلانات والبروزات لأغراض 


الزينة)» وعختلف الحجوم» ويمكنه التغلب على ميلانات السطور باستخدام طريقة خحاصة» كما يحكنه 
تقطيع الأحرف المتداحلة و الفصل فيما بينها. 
دخل البرنامج ملف صورة من نوع ط١إ‏ تنتج عن مسح النص ماسح ضوئي أو من تحهيزة أحرى» 
وبحيث تكون الصورة بلونين فقط. والخر ج ملف نصي يتضمن الحتوى النصي للكتابة باللغة العربيية 
فن الصررة الك دى ٣‏ 
-٦‏ خاقة 
حرى عرض ملخص لبعض تقانات معالحة اللغة العربية» وبعض المنتحات العالمية والأعمال الحليية 
المتعلقة بما. ولازالت لائحة التطبيقات تذحر بالمستجحدات مثل: 

تحسين الإشارة الكلامية لحذف الضجيج منهاء أو استعادة مقاطع صغيرة محذوفة 


فصل اللإشارات الصوتية بعضها عن بعض بحيث يمكن عزل صوت أحد المتحدثين 
فقط. 


تعقب الكلمات المفتاحية» لأعمال المراقبة. 
اوري ميل إشنارات إضافية على إشارة صرية هيت لا مكحن شاعهاء ومن 
للطرف الآحر فقط استخراحها. 
تعرف المتكلم وتحديد اتحاهه أو موقعه. 
تحويل الصوت» بحيث نقلد صوت متحدث معين. 
يتطلب العمل يذه التقانات» فرق عمل خبيرة ودۇوبة» وهذا للأسف غير متوفر لدينا. وتقتصر أغلب 
المسامات على الإشراف على مشاريع طلابية ق المعهد العالي وقي كلية المندسة المعلوماتية. 


المراجع 
[البواب ؛۸] مروان البواب» يى ميرعلم» محمد حسان الطيان» إشراف محمد مرايات» "الكتابة 


الصوتية العربية"» نشرة داحلية» م ركز الدراسات والبحوث العلمية» دمشق» سورياء 


۹A 


[إغنيم .] ندى غنيم» هدى حبش» "تحويل النصوص العربية من رموز كتابية إلى رموز صوتية"» جلة 
جحامعة دمشق للعلوم الأساسية» المجحلد ۹ العدد الأول» e‏ 


[باكير ].٠‏ عفاف باكير» "قاعدة معطيات قواعد الإعراب"» نشرة داحليةء المعهد العالي للعلوم 
التطبيقية والتكنولو حياء دمشق» سوریا» 0 


[الكردي ۲.] بسام الكردي» منير الصباغ» "نظام TT E TET‏ 
المعهد العالي للعلوم التطبيقية والتكنولوحيا» دمشق» سورياء .٠٠٠۲‏ 


[AI-Dakkak 05] Al-Dakkak O., Ghneim N., Abou-Zliekha, and Al-Moubayed S., 
“Emotion Inclusion in an Arabic Text-to-Speech”, Proceedings of 
EUSIPCO 2005. 


[A1I-Dakkak 06] Al Dakkak O. and Harba Y., "Vocal Commands to a Robot by an 
Isolated Words Recognition System using HMM. ICTTA2006, 
Damascus, SYRIA. 


[Buckwalter 02] Buckwalter T'., “Buckwalter Arabic Morphological Analyzer Version 
1.0”. Linguistic Data Consortium, catalog number LDC2002L49, ISBN 
1-58563-257-0, 2. 


[Chenfour 00] Chenfour N., Benabbou A. and Mouradi A., “ Etude et Evaluation de la 
di-syllabe comme Unité Acoustique pour le Systeme de Synthèse Arabe 
PARADIS”, Second International Conference on language resources and 
evaluation, Athenes, Greece, 31 May-2 June 2000. 


[Dutoit 96] Dutoit T'., Pagel V., Pierret N., Bataille F.and van der Vrecken O.,” The 
MBROLA project: towards a set of high quality speech synthesizers free 
of use for non-commercial purposes”, Proc. of ICSLP’96, pp. 1393- 
1396, 1996. 


[Haton 06] Haton j. P., "Automatic Speech Recognition: State of the Art". ICTTA2006, 
Damascus, SYRIA. 


[Safadi 06] Safadi. H., Al Dakkak O. and Ghneim N., "Computational Methods to 
Vocalize Arabic Texts" 2nd Workshop W3C, Herakilon, Greece, 2006. 


